Découverte d'itemsets fréquents fermés sur architecture multicoeurs
نویسندگان
چکیده
Résumé. Dans ce papier nous proposons PLCM, un algorithme parallèle de découverte d’itemsets fréquents fermés basé sur l’algorithme LCM, reconnu comme l’algorithme séquentiel le plus efficace pour cette tâche. Nous présentons aussi une interface de parallélisme à la fois simple et puissante basée sur la notion de Tuple Space, qui permet d’avoir une bonne répartition dynamique du travail. Grâce à une étude expérimentale détaillée, nous montrons que PLCM est le seul algorithme qui soit suffisamment générique pour calculer efficacement des itemsets fréquents fermés à la fois sur des bases creuses et sur des bases denses, améliorant ainsi l’état de l’art.
منابع مشابه
Extraction d'itemsets compacts
Résumé. L’extraction d’itemsets fréquents est un sujet majeur de l’ECD et son but est de découvrir des corrélations entre les enregistrements d’un ensemble de données. Cependant, le support est calculé en fonction de la taille de la base dans son intégralité. Dans cet article, nous montrons qu’il est possible de prendre en compte des périodes difficiles à déceler dans l’organisation des données...
متن کاملFouille de graphes et découverte de règles d'association : application à l'analyse d'images de document
Résumé. Cet article présente une méthode permettant la découverte non supervisée de motifs fréquents représentatifs de symboles sur des images de documents. Les symboles sont considérés comme des entités graphiques porteurs d’information et les images de document sont représentées par des graphes relationnels attribués. Dans un premier temps, la méthode réalise la découverte de sous-graphes dis...
متن کاملExtraction de motifs fermés dans des relations n-aires bruitées
La fouille de relations binaires a été très étudiée via notamment les usages multiples des ensembles fermés fréquents. Cependant, il est courant que les données à traiter se représentent dans des relations n-aires avec n ≥ 3 et il semble donc naturel de vouloir étendre le calcul de motifs fermés dans ce contexte (Ji et al., 2006; Jaschke et al., 2006; Cerf et al., 2008b). Dans le cas des relati...
متن کاملExtension des bases de données inductives pour la découverte de chroniques
Résumé. Les bases de données inductives intègrent le processus de fouille de données dans une base de données qui contient à la fois les données et les connaissances induites. Nous nous proposons d’étendre les données traitées afin de permettre l’extraction de motifs temporels fréquents et non fréquents à partir d’un ensemble de séquences d’évènements. Les motifs temporels visés sont des chroni...
متن کاملAspects des traumatismes fermés de l’abdomen opérés à l’Hôpital Général de Référence Nationale de N’Djaména (HGRN), Tchad: à propos de 49 cas
Résumé Introduction: Les traumatismes fermés de l’abdomen sont fréquents. Méthodes: il s’agissait d’une étude rétrospective sur 49 dossiers de patients opérés pour traumatisme fermé de l’abdomen en cinq ans à l’Hôpital General de Référence Nationale de N’Djaména au Tchad. Les paramètres épidémiologiques, cliniques et thérapeutiques étaient étudiés. Résultats: C’étaient 42 hommes et 7 femmes d’â...
متن کامل